上一篇太多沒用的變數了,可以用變數選擇的方法過濾一下
可以用線性的選(例如Lasso)跟非線性的選(例如random forests)
如果線性跟非線性都選出來很重要的特徵可以特別研究,對他生出更多變數
比起調模型更重要的是加入更多有意義的變數,上篇有很多重要變數都沒加入
例如每月營收、季財報、分點資訊、每周的千張大戶變化、當日的線圖變化...這些都是我平常買賣股票很看重的資訊一定要把他加入模型
當有很多變數前處理要試,模型也有很多參數,會花很多時間嘗試,可以用這個加快嘗試
sklearn的pipeline跟FeatureUnion
https://scikit-learn.org/stable/auto_examples/compose/plot_feature_union.html#sphx-glr-download-auto-examples-compose-plot-feature-union-py
還有不要沉迷於數據分析中而不瞭解股票的漲跌原因,多多充實相關知識想辦法把他變成特徵加入模型